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La presente invention concerne un precede de traduction de donnees d' entree en 
au moins une sequence lexicale de sortie, incluant une etape de decod^e des donnees 
d*entree au cours de laquelle des entites lexicales dont lesdites donnees sont 
representatives sont identifiees au moyen d'au moins un modele. 
5 De tels precedes sont communement utilises dans des applications de 

reconnaissance de parole, ou au moins un modele est mis en oeuvre pour reconnaitre 
des symboles acoustiques presents dans les donnees d' entree, un symbole pouvant etre 
constitue par exemple par un ensemble de vecteurs de parametres d'un espace 
acoustique continu, ou encore par un label attribue a une entite sous-lexical e. 

10 Dans certaines applications, le qualificatif "lexical" s'appliquera a une phrase 

consideree dans son ensemble, en tant que suite de mots, et les entites sous-lexicales 
seront alors des mots, alors que dans d'autres applications, le qualificatif "lexical" 
s'appliquera a un mot, et les entites sous-lexicales seront alors des phonemes ou 
encore des syllabes aptes a former de tels mots, si ceux-ci sont de nature litterale, ou 

15 des chiffres, si les mots sont de nature num6rique, c'est-4-dire des nombres. 

Une premiere approche pour operer une reconnaissance de parole consiste a 
utiliser un type particulier de modele qui presente une topologie reguliere et est 
destine a apprendre toutes les variantes de prononciation de chaque entite lexicale, 
c*est-a-dire par exemple un mot, inclus dans le modele. Selon cette premiere 

20 approche, les parametres d'un ensemble de vecteurs acoustiques propre a chaque 
symbole d'entree correspondant a un mot inconnu doivent etre compares a des 
ensembles de parametres acoustiques correspondant chacun a Tun des tres nombreux 
symboles contenus dans le modele, afin d'identifier un symbole modelis6 auquel 
correspond le plus vraisemblablement le symbole d'entree. Une telle approche garantit 

25 en throne un fort taux de reconnaissance si le modele utilise est bien congu, c'est-^- 
dire quasi-exhaustif, mais une telle quasi-exhaustivite ne peut 8tre obtenue qu'au prix 
d'un long processus d'apprentissage du modele, qui doit assimiler une 6norme 
quantite de donnees representatives de toutes les variantes de prononciation de chacun 
des mots inclus dans ce modele. Get apprentissage est en principe realist en faisant 

30 prononcer par un grand nombre de personnes tous les mots d'un vocabulaire donne, et 
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a enregistrer toutes les variantes de prononciation de ces mots. II apparalt clairement 
que la construction d'un mod^e lexical quasi-exhaustif n'est pas envisageable en 
pratique pour des vocabulaires prdsentant une taiUe superieure a quelques centaines de 
mots. 

5 Une deuxieme approche a 6te con9ue dans le but de reduire le temps 

d'apprentissage necessaire aux applications de reconnaissance de parole, reduction qui 
est essentielle a des applications de traduction sur de tres grands vocabulaires pouvant 
contenir plusieurs centaines de milliers de mots, laquelle deuxieme approche consiste 
a operer une factorisation des entit^s lexicales en les considerant comme des 

10 assemblages d'entites sous-lexicales. k gen6rer un modele sous-lexical modelisant 
lesdites entites sous-lexicales en vue de permettre leur identification dans les donnees 
d'entree, et un modele d' articulation modelisant difiF6rentes combinaisons possibles de 
ces entites sous-lexicales. Selon cette deuxieme approche, un nouveau modele 
dynamique formant le module d'articulation est constitu6 k paitir de chaque entity 

15 sous-lexicale nouvellement identifi6e dans les donnees d'entr6e. lequel modele 
dynamique rend compte detous les assemblages rendus possibles en partant de I'entit^ 
sous-lexicale consideree, et determine une valeur de vraisemblance pour chaque 

assemblage possible. 

Une telle approche, decrite par exemple au chapitre 16 du manuel "Automatic 

20 Speech and Speaker Recognition" edite par Kluwer Academic Publishers, permet de 
reduire considdrablement, par rapport au modele utilise dans le cadre de la premiere 
approche decrite plus haut, les dur6es individuelles des processus d'apprentissage du 
modele sous-lexical et du module d' articulation, car chacun de ces modeles presente 
une structure simple par rapport au module lexical utilise dans la premiere approche. 

25 Cependant, dans la plupart des implementations connues de la deuxi&ne 

approche d6crite ci-dessus, le modele sous-lexical est dupliqu6 k de multiples reprises 
dans le modele d'articulation. Ceci peut etre aisement compris en considerant un 
exemple ou I'unite lexicale est une phrase et les unites sous-lexicales sont des mots. Si 
le modele d'articulation est d'un type bi-gramme, c'est-i-dtre qu'il rend compte de 

30 possibiUtes d'assemblage de deux mots successifs et de probabilites d'existence de 
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tels assemblages, chaque mot retenu a I'issue de la sous-etape d' identification dewa 
Stre etudi6, en reference au modele d* articulation, avec tous les autres mots retenus 
ayant pu preceder le mot consider^. Si P mots ont ete retenus a Tissue de la sous-etape 
d'identification, P couples de mots devront §tre construits pour chaque mot a 
5 identifier, avec P valeurs de probabilite d' existence, chacune associee a un couple 
possible. Dans le cas d'un modele d' articulation plus realiste de type tri-gramme, qui 
rend compte de possibilit^s d'assemblage de trois mots successifs et de probabilites 
d' existence de tels assemblages, le modele d' articulation devra comporter, pour 
chaque mot a identifier, P fois P triplets de mots avec autant de valeurs de probabilite 

10 d'existence. Les modeles d' articulation mis en oeuvre dans la deuxieme approche ont 
done une structure simple, mais repr6sentent un volume considerable de donnees k 
memoriser, a mettre a jour et k consulter. On congoit aisement que la creation et 
Texploitation de tels modeles donne lieu a des acces memoire dont la gestion est 
rendue complexe par le volume de donnees a traiter, et par la repartition desdites 

15 donnees. Dans des applications de type langage naturel, pour lesquelles des modeles 
plus realistes de type N-gramme, ou N est le plus souvent superieur k deux, sont mi$ 
en oeuvre, les acces memoire evoques precedemment presentent des tempis 
d' execution incompatibles avec des contraintes de type * temps reel" necessitant des 
acces memoire tres rapides. 

20 Par ailleurs, chaque mot peut lui-meme etre considere vis-a-vis de syllabes ou de 

phonemes qui le composent comme une entite lexicale d'un niveau inferieur a celui 
d'une phrase, entite lexicale pour la modelisation de laquelle il faut egalement recourir 
a un modele d' articulation de type N-gramme avec plusieurs dizaines d'entites sous- 
lexicales possibles dans le cas des phonemes. 

25 II apparait clairement que les multiples duplications des modeles sous-lexicaux 

auxquelles font appel les modeles d'articulation dans les implementations connues de 
la deuxieme approche prohibent Tutilisation de celle-ci dans des applications de 
recoimaissance de parole dans le cadre d'applications de type tres grands vocabulaires, 
qui comportent plusieurs centaines de milliers de mots. 
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L»invention a pour but de rem&iier dans une large mesure k cet inconvenient, en 
proposant un procede de traduction qui ne necessite pas de multiples duplications de 
modeles sous-lexicaux pour valider des assemblages d'entit6s sous-lexicales. et 
simplifie ainsi 1' implementation dudit procede de traduction, et en particulier la 
gestion d'acces memoire utiles a ce procede. 

En effet, un proc^e de traduction conforme au paragraphe introductif, incluant 
une 6tape de decodage au cours de laquelle des entites sous-lexicales dont les donnees 
d'entree sont representatives sont identifiees au moyen d'un premier modele construit 
sur la base d'entit^s sous-lexicales preddterminees, et au cours de laquelle sont 
g6n6r6es. au for et a mesure que les entites sous-lexicales sont identifiees et en 
reference i au moins un deuxidme modele construit sur la base d'entites lexicales, 
diverses combinaisons possibles desdites entites sous-lexicales, est caracteris6 selon 
I'invention en ce que Tetape de d^dage inclut une sous-6tape de mdmorisation 
d'une pluralite de combinaisons possibles desdites entites sous-lexicales, la 
15 combinaison la plus vraisemblable etant destinee k former la sequence lexicale de 
sortie. 

Du fait que divers assemblages d'entites sous-lexicales sont memorises au fur et 
a mesure que ces entites sont produites, il n'est plus necessaire de construire apres 
identification de chacune desdites entites sous-lexicales un modele dynamique 

20 reprenant toutes les entites sous-lexicales possibles, ce qui permet d'eviter les 
duplications 6voquees plus haut et les problemes de gestion memoire y afferant. 

La possibility de m6moriser plusieurs combinaisons differentes permet de garder 
une trace de plusieurs assemblages possibles d'entites sous-lexicales, chacun 
pr^sentant une vraisemblance propre k I'instant ou cet assemblage est g6n6r6, laquelle 

25 vraisemblance pouvant 6tre affectee fevorablement ou d^fevorablement apres analyse 
de sous-entites lexicales ult^rieurement produites. Ainsi, une selection d'un 
assemblage presentant la plus forte vraisemblance a un instant donn6. raais qui sera 
finalement juge peu vraisemblable a la lumiere d'entit^ sous-lexicales ulterieures ne 
provoquera pas une elimination systematique d'autres assemblages, qui pourront 

30 finalement s'averer plus pertinents. Cette variante de invention permet done de 
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conserver des donnees rq)resentant, sous forme de diflferents historiques, differentes 
interpretations des donnees d'entree, interpretations dont la plus vraisemblable pourra 
Stre identifiee et retenue pour former la sequence lexicale de sortie lorsque toutes les 
entites sous-lexicales auront elles-mSme ete identifiees. 
5 Dans un mode de realisation particulier de cette variante de T invention, la 

memorisation d'une combinaison est assujettie a une validation operee en reference au 
moins au deuxieme modele. 

Ce mode de realisation permet de realiser de maniere simple un filtrage des 
assemblages qui paraissent peu vraisemblables a la lumiere du deuxieme modele. 

10 Seuls seront retenus et m6moris6s les assemblages les plus plausibles, les autres 
assemblages n'etant pas memorises et done pas ulterieurement pris en consideration. 

Dans une variante de ce mode de realisation, la validation de memorisation 
pourra 6tre effectu^e en reference k plusieurs modeles de niveaux equivalents et/ou 
differentes, un niveau rendant compte de la nature sous-lexicale, lexicale ou encore 

15 grammatical e d'un modele. 

Dans un mode de realisation particulierement avantageux de cette variante de 
rinvention, une validation de memorisation d'une combinaison est accompagnee 
d'une attribution a la combinaison a m6moriser d'une valeur de probabilite 
representative de la vraisemblemce de ladite combinaison. 

20 Ce mode de realisation permet de moduier la nature binaire du filtrage operee 

par la validation ou Tabsence de validation de la memorisation d'une combinaison, en 
affectant une appreciation quantitative a chaque combinaison memorisee. Ceci 
permettra une meilleure appreciation de la vraisemblance des diverses combinaisons 
qui auront ete memorisees, et done une traduction de meilleure qualite des donnees 

25 d'entree. 

On pourra en outre pr6voir que differentes operations de validation portant sur 
differentes combinaisons relatives k un m€rae etat du premier module sont executees 
de fa5on contigue dans le temps. 
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Ceci permettra de reduire encore le volume des acces memoire et des 
duplications de calcul, en traitant en une seule fois toute une famille d' informations 
qu'il faudra sinon meraoriser et lire a de multiples reprises. 

Dans un mode de realisation particulier de I'invention, I'etape de decodage met 
5 en (Euvre un algorithme de Viterbi applique a un premier modele de Markov constitue 
d'entit^s sous-lexicales, sous contrdle dynaraique d'un deuxieme modele de Markov 
repr&entatif de combinaisons possibles d'entites sous-lexicales. 

Ce mode de realisation est avantageux en ce qu'il utilise des moyens eprouv6s et 
individuelleraent connus de I'homme du m6tier, le controle dynamique obtenu grace 
10 au deuxieme modele de Markov permettant de valider les assemblages d'entites sous- 
lexicales au for et a mesure que lesdites entites sont identifi^es au moyen de 
I'algorithme de Viterbi, ce qui evite d'avoir a construire apr^s identification de chaque 
entite sous-lexicale un nouveau module dynamique reprenant toutes les entity sous- 
lexicales possibles semblable k ceux utilises dans les implementations connues de la 
15 deuxieme approche evoquee plus haut. 

L'invention conceme egalement un systeme de reconnaissance de signaux 
acoustiques mettant en oeuvre un proced6 tel que decrit ci-dessus. 

Les caracteristiques de l'invention mentionn^es ci-dessus, ainsi que d'autres, 
apparaitront plus clairement k la lecture de la description suivante d'un exemple de 
20 realisation, ladite description etant feite en relation avec les dessins joints, parmi 
lesquels : 

La Fig.l est un schema fonctionnel decrivant un systdme de reconnaissance 
acoustique dans lequel un precede oonforme k l'invention est mis en CBuvre, 

La Fig.2 est un schema fonctionnel decrivant un decodeur destine a executer une 
25 premiere etape de decodage dans ce mode de mise en oeuvre particulier de l'invention. 
et 

La Fig.3 est un schema fonctionnel decrivant un decodeur destine k executer une 
deuxieme etape de decodage conforme au precede selon l'invention. 

La Fig.l represente schematiquement un systeme SYST de reconnaissance 
30 acoustique selon un mode de mise en oeuvre particulier de l'invention, destine k 
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traduire un signal acoustique d' entree ASin en une sequence lexicale de sortie 
OUTSQ, Le signal d'entree ASin est constitue par un signal electronique analogique, 
qui pourra provenir par exemple d'un microphone non represente sur la figure. Dans 
le mode de realisation decrit ici, le systeme SYST inclut un etage d'entree FE, 
5 contenant un dispositif de conversion analogique/numerique ADC, destine a fournir 
un signal numerique ASin(l:n), forme d'echantillons ASin(l), ASin(2).., ASin(n) 
codes chacun sur b bits, et representatif du signal acoustique d'entree ASin, et un 
module d'echantillonnage SA, destine a convertir le signal acoustique numerise 
ASin(l:n) en une sequence de vecteurs acoustiques AVin, chaque vecteur etant muni 
10 de coraposantes AVI, AV2. . . AVr ou r est la dimension d'un espace acoustique d6fini 
pour une application donnee a laquelle le systeme de traduction SYST est destine, 
chacune des composantes AVi (pour i=l a r) 6tant evaluee en fonction de 
caracteristiques propres a cet espace acoustique. 

Le systeme SYST inclut en outre un premier decodeur DECl, destin6 a fourair 
15 une selection Intl, Int2...IntK d'interpretations possibles de la sequence de vecteurs 
acoustiques AVin en reference a un module MDl construit sur la base d'entites sous- 
lexicales predeterminees . 

Le systeme SYST inclut de plus un deuxieme decodeur DEC2 dans lequel un 
procede de traduction conforme a Tinvention est mis en oeuvre en vue d'analyser des 
20 donnees d'entree constituees par les vecteurs acoustiques AVin en reference a un 
premier modele construit sur la base d'entites sous-lexicales predeterminees, par 
exemple le modele MDl, et en reference a au moins un deuxieme modele MD2 
construit sur la base d'entites lexicales representatives des interpretations Intl, 
Int2...IntK s61ectionnees par le premier decodeur DECl, en vue d'identifier celle 
25 desdites interpretations qui devra constituer la sequence lexicale de sortie OUTSQ. 

La fig.2 represente plus en detail le premier decodeur DECl, qui inclut une 
premiere machine de Viterbi VMl, destinee a ex6cuter une premiere sous-etape de 
decodage de la sequence de vecteurs acoustiques AVin representative du signal 
acoustique d'entree et prealablement generee par I'etage d'entree FE, laquelle 
30 sequence sera en outre avantageusement memorisee dans une unite de stockage 
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MEMl pour des raisons qui apparaitront dans la suite de I'expose. La premiere sous- 
etape de decodage est op^r^e en reference a un tnodele de Markov MDll autorisant 
en boucle toutes les entites sous-lexicales, de preference tous les phonemes de la 
langue dans laquelle le signal acoustique d'entee doit 6tre traduit si Ton considdre que 
les entites lexicales sont des mots, les entites sous-lexicales etant representees sous 
forme de vecteurs acoustiques predetermines. 

La premiere machine de Viterbi VMl est apte a restituer une sequence de 
phonemes Phsq qui constitue la plus proche traduction phon6tique de la sequence de 
vecteurs acoustiques AVin. Les traitements ulterieurs realises par le premier decodeur 
DECI se feront ainsi au niveau phon^que, et non plus au niveau vectoriel, ce qui 
reduit consid^rablement la complexite desdits traitements, chaque vecteur 6tant une 
entite multidimensionnelle presentant r composantes. tandis qu'un phoneme peut en 
principe Stre identifie par un label unidimensionnel qui lui est propre, comme par 
exemple un label "OIT attribu6 k une voyelle orale 'V, ou un label "OT attribue k 
une consonne frictive non-voisee "f" La sequence de phonemes Phsq g6n6ree par la 
premiere machine de Viterbi VMl est ainsi constituee d'une succession de labels plus 
ais^ment manipulables que ne le seraient des vecteurs acoustiques. 

Le premier decodeur DECI inclut une deuxieme machine de Viterbi VM2 
destinee a executer une deuxieme sous-etape de decodage de la sequence de phonemes 
Phsq gen6ree par la premi^ machine de Viterbi VMl. Cette deuxieme 6tape de 
decodage est opdree en re^rence k un modele de Markov MD12 constitue de 
transcriptions sous-lexicales d'entit^s lexicales, c'est-a-dire dans cet exemple de 
transcriptions phon6tiques de mots presents dans le vocabulaire de la langue dans 
laquelle le signal acoustique d'entr6e doit 6tre traduit. La deuxieme machine de 
Viterbi est destinee a interpreter la sequence de phonemes Phsq, qui est fortement 
bruitee du fait que le modele MDll utilis6 par la premise machine de Viterbi VMl 
est d'une grande simpHcite, et met en oeuvre des predictions et des coraparaisons entre 
des suites de labels de phonemes contenus dans la sequence de phonemes Phsq et 
diverses corabinaisons possibles de labels de phonemes pr6vues dans le module de 
Markov MD12. Bien qu'une machine de Viterbi ne restitue usuellement que celle des 



sequences qui presente la plus grande probabilite, la deuxieme machine de Viterbi 
VM2 mise en oeuvre ici restituera avantageusement toutes les sequences de phonemes 
Isql, lsq2...1sqN que ladite deuxidme machine VM2 aura pu reconstituer, avec des 
valeurs de probabilite associees pi, p2...pN qui auront ete calculees pour lesdites 
sequences et seront representatives de la fiabilite des interpretations du signal 
acoustique que ces sequences representent, 

Toutes les interpretations possibles Isql, lsq2...1sqN etant rendues 
automatiquement disponibles a Tissue de la deuxieme sous-etape de decodage, une 
selection de K interpretations Intl, Int2.. .IntK qui presentent les plus fortes valeurs de 
probabilite est aisee quelle que soit la valeur de K qui aura ete choisie. 

Les premiere et deuxieme machines de Viterbi VMl et VI42 peuvent 
fonctionner en parallele, la premiere machine de Viterbi VMl gen6rant alors au fur et 
k mesure des labels de phonemes qui seront immediatement pris en compte par la 
deuxieme machine de Viterbi VM2, ce qui permet de reduire le delai total per9u par 
un utilisateur du systeme n^cessaire a la combinaison des premiere et deuxidme sous- 
etapes de decodage en autorisant la mise en oeuvre de Tensemble des ressources de 
calcul necessaires au fonctionnement du premier decodeur DECl des que , les vecteurs 
acoustiques AVin representatifs du signal acoustique d' entree apparaissent, et non pas 
apres qu'ils aient ete entierement traduits en une sequence complete de phonemes 
Phsq par la premiere machine de Viterbi VMl. 

La Fig.3 represente plus en detail un deuxieme decodeur DEC2 conforme a un 
mode de realisation particulier de I'invention. Ce deuxieme decodeur DEC2 inclut une 
troisieme machine de Viterbi VM3 destinee a analyser la sequence de vecteurs 
acoustiques AVin representative du signal acoustique d'entr6e pr^alablement 
memorisee dans Funit^ de stockage MEMl. 

A cet efFet, la troisieme machine de Viterbi VMS est destinee a executer une 
sous-etape d'identification au cours de laquelle les entites sous-lexicales dont les 
vecteurs acoustiques AVin sont repr6sentatifs sont identifiees au moyen d'un premier 
modele construit sur la base d'entites sous-lexical es predeterminees, dans cet exemple 
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le modele de Markov MDl 1 mis en oeuvre dans le premier decodeur et deja decrit plus 

haut. 

La troisieme machine de Viterbi VMS gen^re en outre, au fiir et i mesure que 
ces entites sont identifiees et en reference a au moins un modele de Markov specifique 
5 MD3 construit sur la base d'entites lexicales, diverses combinaisons possibles des 
entites sous-lexicales, la combinaison la plus vraisemblable etant destinee a former la 
sequence lexicale de sortie OUTSQ. Le modele de Markov sp6cif.que MD3 est ici 
specialement gener6 a cet eflfet par un module de creation de modele MGEN, et est 
uniquement representatifd' assemblages possibles de phonemes au sein des sequences 
10 de mots formees par les diverses interpretations phon^iques Intl, Int2,...IntK du 
signal acoustique d'entree d61ivrees par le premier decodeur, lesquels assemblages 
sont repr6sentes par des sous-modeles extraits du modMe lexical MD2 par le module 
de creation de module MGEN. Le modele de Markov specifique MD3 presente done 
une taille restreinte du feit de sa specificite. 

Lorsque la troisieme machine de Viterbi VMS se trouve dans un aat ni donne. 
auquel sont associes un historique hp et une valeur de probabilite Sp, s'U existe dans 
le modele de Markov MDll une transition dudit etat ni vers un etat nj munie d'un 
marqueur M, lequel marqueur pouvant par exemple etre constitue par le label d'un 
phoneme dont le dernier etat est ni ou d'un phoneme dont le premier etat est nj, la 
troisieme machine de Viterbi VMS associera a Tetat nj un nouvel historique hq et une 
nouvelle valeur de probabiUte Sq qui seront g6neres en reference au modele specifique 
MD3, sur la base de I'historique hp, de sa valeur de probabilite associee Sp et du 
marqueur M, la valeur de probability Sp pouvant en outre etre egalement modifiee en 
r6f6rence au modele de Markov MDll. Cette operation sera r6petee pour tous les 
25 historiques assocife k l'6tat ni. Si un meme historique hk est associe a plusieurs 
reprises a un mSme aat du module de Markov MDll avec diff^rentes valeurs de 
probabilite Spl,...Spq, conformement a I'algorithme de Viteri^i, seule la valeur de 
probabilite la plus elevee sera conservee et attribuee en tant que valeur de probabiUte 
Sp a I'historique hk. 
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Chaque etat nj est memorise dans une unite de .stockage MEM2 avec ses 
difFerents historiques hq et une valeur de probabilite Sq propre a chaque historique, et 
ce jusqu'a ce que latroisieme machine de Viterbi VMS ait identifie tous les phonemes 
contenus dans la sequence de vecteurs acoustiques d' entree AVin et ait atteint un 
5 dernier etat nf au fil d'une pluralite d' historiques hf representant les diverses 
combinaisons possibles des phonemes identifies. Celui de ces historiques auquel aura 
ete attribuee la plus forte valeur de probabilite Sfmax sera retenu par un decodeur de 
memoire MDEC pour former la sequence lexicale de sortie OUTSQ. 

Le modele de Markov MD3 opere done un contrdle dynamique permettant de 

10 valider les assemblages de phonemes au fur et a mesure que lesdits phonemes sont 
identifies par la troisieme machine de Viterbi VMS, ce qui 6vite d^avoir a dupliquer 
ces phonemes pour former des modeles tels ceux utilises dans les implementations 
connues de la deuxieme approche evoqu^e plus haut. De la sorte, les acces aux unites 
de stockage MEMl et MEM2, ainsi qu'au difFerents modeles de Markov MDll, 

15 MD12, MD2 et MDS mis en oeuvre dans Texemple d^crit ci-dessus necessitent une 
gestion peu complexe, du fait de la simplicite de structure desdits modeles et des 
informations destinees a etre memoris^es et lues dans lesdites unites de stockage. Ces 
acces memoire peuvent done 6tre executes suffisamment rapideraent pour rendre le 
systeme decrit dans cet exemple apte a accomplir des traductions en temps reel de 

20 ' donnees acoustiques d* entree en sequences lexical es de sortie. 

Bien que P invention ait ete decrite ici dans le cadre d'une application au sein 
. d'un systeme incluant deux decodeurs disposes en cascade, il est tout-a-fait 
envisageable, dans d'autres modes de mise en oeuvre de Tinvention, de n'utiliser 
qu*un unique decodeur semblable au deuxieme decodeur decrit plus haut, qui pourra 

25 par exemple op6rer une analyse acoustico-phonetique et memoriser, au fur et a mesure 
que des phonemes seront identifies, diverses combinaisons possibles desdits 
phonemes, la combinaison de phonemes la plus vraiserablable etant destinee a fomier 
la sequence lexicale de sortie. 
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REVENDICATIONS 

1) Precede de traduction de donnees d'entr6e en au moins une sequence lexicale 
de sortie, incluant une etape de decodage des donnees d'entree au cours de laquelle 
des entites sous-lexicales dont lesdites donnees sont representatives sont identifi6es au 
moyen d'un premier modele construit sur la base d'entites sous-lexicales 

5 predeterminees, et au cours de laquelle sont generees, au fur et a mesure que les 
entites sous-lexicales sont identifiees et en reference a au moins un deuxieme modele 
construit sur la base d'entites lexicales, diverses combinaisons possibles desdites 

entites sous-lexicales, 

precede caract6rise en ce que I'etape de decodage inclut une sous-etape de 
10 memorisation d'une pluralite de combinaisons possibles desdites entites sous- 
lexicales, la combinaison la plus vraisemblable 6tant destinee k former la sequence 
lexicale de sortie. 

2) Proc6d6 de traduction selon la revendication 1, caract6rise en ce que la 
memorisation d'une combinaison est assujettie k une validation op6r^ en reference au 

15 moins au deuxieme modele. 

3) Procede de traduction selon la revendication 2, caract^s^ en ce qu'une 
validation de memorisation d'une combinaison est accompagn6e d'une attribution k la 
combinaison a memoriser d'une valeur de probabilite representative de la 
vraisemblance de ladite combinaison. 

20 4) Proc6d6 de traduction selon I'une des revendications 2 ou 3, caract^rise en ce 

que differentes op6rations de validation portant sur differentes combinaisons relatives 
a un m6me etat du premier module sont ex^tees de fa9on contiguS dans le temps. 

5) Precede de traduction selon la revendication 1, caracterise en ce que Tetape 
de decodage met en ceuvre un algorithme de Viterbi applique a un premier modele de 

25 Maricov constitue d'entites sous-lexicales, sous contrdle dynamique d'un deuxieme 
module de Markov representatif de combinaisons possibles d'entites sous-lexicales. 

6) Systeme de reconnaissance vocale mettant en oeuvre un procede de traduction 
conforme a I'une des revendications 1 a 5. 
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